Staggered DID分析 総合レポート

デジタルコンテンツ視聴の因果効果検証 | 観測期間: 2023/4 - 2025/12

1. 分析要件定義

1.1 分析目的

デジタルコンテンツ(Webinar, e-contents, web講演会)の視聴が、品目コード=00001<の納入額に与える因果効果を推定する。視聴開始時期が施設医師ごとに異なる「ずれた処置(staggered treatment)」に対応したDID推定量を使用する。

分析対象は 品目コード=00001 (ENT) の売上データに限定し、医師は RW医師 のみを使用する。

1.2 データ構造

売上データ (sales.csv)

  • 日別・施設別・品目別の売上実績
  • カラム: 日付, 施設(本院に合算)コード, DCF施設コード, 品目コード, 実績
  • 日付: YYYYMMDD文字列、実績: 数値文字列
  • 全品目: 58,848 行 → ENT品目: 18,704 行

デジタル視聴データ (デジタル視聴データ.csv)

  • Webinar / e-contents の視聴ログ
  • カラム: 活動日_dt, 品目コード, 活動種別, 活動種別コード, fac_honin, doc 等
  • 2,666 行

活動データ (活動データ.csv)

  • MR入力の活動記録 (web講演会を含む)
  • カラム: 活動日_dt, 品目コード, 活動種別コード, 活動種別, fac_honin, doc 等
  • 9,893 行 → web講演会抽出後に視聴データと結合

RW医師リスト (rw_list.csv)

  • ENT対象医師リスト (品目カラムなし)
  • カラム: doc, doc_name, fac_honin, fac_honin_name, fac, fac_name, seg
  • seg非空 = RW対象
  • 全体: 268 行 → seg非空: 230 行
視聴データの結合: デジタル視聴データ (Webinar + e-contents) と 活動データ (web講演会のみ抽出) を結合して分析用の視聴データとする。 結合後: 2,955 行

1.3 分析パラメータ

期間設定

  • 観測期間: 2023/4 - 2025/12 (33ヶ月)
  • Wash-out期間: 2ヶ月 (2023/4-5)
  • 最終適格月: 2025/9 (month 29)

除外基準

  • 売上データ: ENT品目コード (00001) 以外を除外
  • 医師リスト: seg列が空欄の医師を除外
  • 視聴データ: ENT品目 + 対象チャネル (Webinar, e-contents, web講演会) のみ
  • 1施設に複数医師が所属 → 施設除外
  • 1医師が複数施設に所属 → 医師除外
  • wash-out期間に視聴あり → 除外
  • 初回視聴が2025/10以降 → 除外

1.4 推定手法

TWFE (Two-Way Fixed Effects)

  • 標準的な双方向固定効果モデル
  • 施設固定効果 + 時間固定効果
  • クラスターロバストSE(施設レベル)

Callaway-Sant'Anna (2021)

  • ずれた処置に頑健な推定量
  • コホート別ATT(g,t) → 動的効果集約
  • Bootstrap SE (N=200全体, N=100チャネル別)

1.5 用語解説

用語補足説明
DID (差の差分法)処置群と対照群の「前後差の差」で因果効果を推定する準実験的手法
ATT (Average Treatment effect on the Treated)処置を受けた群における平均処置効果
TWFE (Two-Way Fixed Effects)個体(施設)と時点の両方の固定効果を制御する回帰モデル
Callaway-Sant'Anna (CS)処置開始時期が異なる場合のバイアスを補正するDID推定量
CATE (Conditional Average Treatment Effect)属性条件付きの平均処置効果(異質的処置効果)
コホート同一時期に処置を受け始めた施設のグループ
イベント時間 (event time)処置開始からの相対的な経過月数 (e=0が処置開始月)
Bootstrapリサンプリングにより標準誤差・信頼区間を算出する統計手法
95% CI (信頼区間)真の効果がこの範囲に含まれる確率が95%である区間
SE (標準誤差)推定値のばらつきの大きさ、小さいほど推定が安定
p値帰無仮説(効果ゼロ)が正しい場合にこの推定値以上が観測される確率
クラスターロバストSE施設内の観測値の相関を考慮した標準誤差の補正
解析対象集団の選定フローデータソースから段階的な除外基準を適用して最終解析対象を確定する過程の図示
fac_honin (施設本院コード)本院に合算したコードで、分析の施設単位として使用

2. 解析対象集団の選定

解析対象集団の選定フローを以下に示す。売上データ・RW医師リスト・視聴データの各ソースからENT品目を抽出し、施設-医師の1対1対応・wash-out・遅延視聴者の除外を経て、最終的な処置群・対照群を確定した。

解析対象集団の選定

除外フロー集計

ステップ 条件 除外数 残余数
初期 全品目売上データ - 58727 行
[0a] ENT品目フィルタ 品目コード = 00001 のみ 40127 行 18600 行
[0b] RW医師フィルタ rw_list.csv の seg 非空 38 行 230 行 (158施設 / 214医師)
[0c] 視聴データ結合 デジタル視聴 + 活動(web講演会) ENT品目 9604 行 2955 行
[A] 複数医師施設 1施設に2名以上の医師 53施設 105施設
[B] 複数施設所属 1医師が2施設以上に所属 16医師 96施設
[C] Wash-out視聴 2023/4-5に視聴あり 4医師 92施設
[D] 遅延視聴者 初回視聴 >= 2025/10 3医師 89施設
最終 分析対象 - 89施設 (処置55 + 対照34)

3. 基礎集計

3.1 処置群・対照群の記述統計

施設数 月次売上額 平均 月次売上額 SD パネル行数
対照群 (未視聴) 34 200.3 124.1 1122
処置群 (視聴) 55 208.2 137.1 1815

3.2 コホート分布

処置群の初回視聴月ごとの施設数分布:

コホート分布

3.3 属性分布 (処置群 / 対照群)

baseline_cat

処置群 19 19 17
対照群 11 10 13

4. 視聴パターンの可視化

除外された医師と解析対象の医師の視聴パターンを比較する。

凡例: (a) wash-out期間(2023/4-5)に視聴がある医師 → 除外 / (b) 複数施設に所属する医師 → 除外 / (c) 初回視聴が2025/10以降の医師 → 除外 / (d) 解析対象(処置群)の代表的視聴パターン
視聴パターン可視化

5. DID推定結果

5.1 全体推定結果の比較

手法 ATT (処置群の平均処置効果) SE (標準誤差) p値 95% CI (信頼区間) 有意性
TWFE (全体) 29.21 7.58 0.000117 [14.35, 44.06] ***
CS (全体) 35.37 8.44 0.000028 [18.83, 51.91] ***
CS (Webinar) 31.64 9.29 0.000661 [13.43, 49.85] ***
CS (e-contents) 33.62 7.06 0.000002 [19.79, 47.45] ***
CS (web講演会) 28.96 8.09 0.000342 [13.11, 44.81] ***

5.2 CS動的効果 (全体)

イベント時間 ATT SE 95% CI下限 95% CI上限
e=-6 -6.86 6.40 -19.41 5.69
e=-5 6.96 6.06 -4.90 18.83
e=-4 12.99 4.20 4.77 21.22
e=-3 8.73 5.08 -1.24 18.69
e=-2 3.37 3.84 -4.16 10.89
e=-1 0.00 0.00 0.00 0.00
e=0 20.52 4.08 12.52 28.52
e=1 24.88 5.45 14.19 35.57
e=2 22.28 5.50 11.50 33.07
e=3 25.68 4.96 15.95 35.41
e=4 34.61 5.30 24.23 44.99
e=5 26.75 6.29 14.41 39.09
e=6 33.48 7.04 19.69 47.27
e=7 27.87 7.30 13.56 42.19
e=8 30.63 6.78 17.34 43.92
e=9 39.08 7.77 23.85 54.31
e=10 40.42 8.13 24.49 56.35
e=11 41.32 8.44 24.77 57.87
e=12 44.35 9.78 25.19 63.51
e=13 39.54 9.25 21.42 57.66
e=14 42.01 10.18 22.06 61.97
e=15 46.05 11.17 24.16 67.94
e=16 41.55 12.10 17.83 65.28
e=17 44.33 12.34 20.14 68.51
e=18 46.40 12.56 21.79 71.02

5.3 可視化

Staggered DID Results

5.4 ロバストネスチェック: MR活動共変量

MR活動(面談、面談_アポ、説明会等)の月次実施回数を共変量として追加した場合の推定結果。 デジタル視聴の効果推定がMR活動の時変交絡に頑健かどうかを検証する。

モデル ATT SE p値 95% CI 有意性
TWFE (メイン) 29.21 7.58 0.000117 [14.35, 44.06] ***
TWFE (+MR活動共変量) 29.20 7.58 0.000117 [14.35, 44.06] ***
共変量 係数 SE p値 有意性
MR活動回数 -0.05 0.70 0.9381 n.s.

ATT変化率: 0.0%

解釈: MR活動(面談等)を共変量として追加してもATTの変化が小さい場合(目安: 変化率10%未満)、 MR活動による時変交絡の影響は限定的であり、メインTWFE推定の信頼性が支持される。

6. CATE分析 (条件付き平均処置効果)

6.1 サブグループ別ATT推定値

baseline_cat

レベル N ATT SE 95% CI
19 23.5 6.8 [10.2, 36.8]
19 19.6 9.1 [1.7, 37.4]
17 66.9 15.9 [35.7, 98.1]

6.2 サブグループ間差の検定

baseline_cat

比較 SE p値 有意性
低 - 中 4.0 10.9 0.7151 n.s.
低 - 高 -43.3 17.9 0.0157 *
中 - 高 -47.3 18.6 0.0108 *

6.3 Forest Plot

CATE Forest Plot

6.4 動的効果 (サブグループ別)

CATE Dynamic Effects

7. 医師視聴パターン分析

⚠️ 重要な注意:内生性の問題
視聴回数は医師の自発的行動であり、制御不可能な変数です。
- 元々関心が高い医師ほど多く視聴(選択バイアス)
- 処方意向が高い医師ほど視聴(逆因果)
- 配信はできるが視聴は強制できない

したがって、本分析の結果は 「関連性」 であり 「因果効果」ではありません
推定値は真の効果の上限値として解釈すべきです。

概要

以下の3つの分析アプローチで、視聴パターンと売上の関連性を多角的に検証します:


7.1 視聴回数別限界効果 + 配信成功率を考慮した期待効果分析

分析の目的: 視聴1回目、2回目、3回目...それぞれの限界効果を推定し、配信成功率(視聴確率)を考慮した期待効果を算出。 同じ予算で、既存医師への追加配信 vs 新規医師への初回配信、どちらが効果的かを定量的に評価。

重要な発見:
新規医師の視聴確率は極めて低く(約2%)、既存医師(既に視聴経験がある医師)への配信の方が 期待効果が圧倒的に高い(最大219倍)。

7.1.1 視聴回数別の限界効果

医師×月レベルのパネルデータで、視聴回数別の限界効果を推定(TWFE回帰)。

視聴回数 限界効果(万円) SE p値 有意性
1回目 4.32 3.37 0.1997 n.s.
2回目 10.64 4.33 0.0141 *
3回目 11.79 3.95 0.0029 **
4回目 17.22 4.43 0.0001 ***
5回目以上 34.68 5.93 0.0000 ***

視聴回数が増えるほど限界効果が増加する傾向(逓増効果)。 5回目以上の限界効果は1回目の約8倍。

7.1.2 視聴確率(配信成功率)

配信履歴から、各段階での視聴確率を推定。

段階 視聴確率
新規医師(初回視聴) 3.4%
既存1回 → 2回目 29.2%
既存2回 → 3回目 41.8%
既存3回 → 4回目 26.4%
既存4回 → 5回目 54.2%
重大な発見:
新規医師の視聴確率は わずか3.4%。 つまり、97%の配信が無駄になる。
一方、既存医師の継続視聴確率は29-62%と高く、配信効率が圧倒的に良い。

7.1.3 期待効果(視聴確率 × 限界効果)

配信成功率を考慮した、実質的な期待効果を算出。

配信対象 視聴確率 限界効果 期待効果 対新規比
新規医師 1回目 3.4% 4.32万円 0.15万円 1.0倍
既存医師 2回目 35.5% 10.64万円 3.78万円 25倍
既存医師 3回目 47.4% 11.79万円 5.59万円 38倍
既存医師 4回目 56.6% 17.22万円 9.75万円 65倍
既存医師 5回以上 50.5% 34.68万円 17.53万円 118倍

💡 最適配信戦略

全ての視聴回数で既存医師の期待効果が高い(常に既存医師優先)

📊 期待効果ランキング:
1. 既存5回以上: 17.53万円
2. 既存4回目: 9.75万円
3. 既存3回目: 5.59万円
4. 既存2回目: 3.78万円
5. 新規1回目: 0.15万円
✅ 実務的推奨:
• 既存視聴医師への配信を最優先
• 視聴回数が多いほど効率的
• 新規医師への配信は効率が極めて低い
• 限られた予算は既存医師に集中投下

7.1.4 可視化

Physician Viewing Analysis

(a) 視聴回数別の限界効果 / (b) 視聴確率(継続率) / (c) 期待効果の比較 / (d) 期待ROI / (e) 配信優先順位 / (f) 最適配分メッセージ


7.2 セッションベース視聴パターン + 傾向スコア調整

視聴回数だけでなく 視聴の時間的パターン を考慮し、医師・施設属性による 選択バイアスを調整

7.2.1 セッション分類の考え方

セッション定義:
視聴と視聴の間隔が 30 日以上空いた場合、別セッションとみなす。

視聴パターン分類:
- 短期集中型: 短期間に集中視聴(1セッション、期間≤30日)
- 長期継続型: 長期間継続視聴(1セッション、期間>30日)
- 定期視聴型: 複数セッション、間隔が短い(平均≤60日)
- 断続視聴型: 複数セッション、間隔が長い(平均>60日)
- 単発視聴: 1回のみ視聴
- 未視聴: 視聴なし

7.2.2 視聴パターン分布

パターン 医師数 割合
未視聴 34 38.2%
断続視聴型 28 31.5%
定期視聴型 22 24.7%
単発視聴 4 4.5%
短期集中型 1 1.1%

7.2.3 傾向スコア推定

視聴有無を、医師・施設属性(経験年数、診療科、地域、施設タイプ)で予測するLogitモデルを推定。

指標
Pseudo R2 0.1507
視聴群の平均傾向スコア 0.6923
未視聴群の平均傾向スコア 0.4977

Pseudo R2が 15.07% で、視聴群の平均傾向スコアが未視聴群より高い。 これは視聴医師が特定の属性(経験豊富、都市部など)に偏っていることを示唆。

7.2.4 IPW調整後の平均売上

逆確率重み付け(IPW)により、属性バイアスを調整した各パターンの平均売上を推定。

パターン IPW調整後平均売上 医師数
定期視聴型 255.7 22
未視聴 219.3 34
断続視聴型 193.7 28
単発視聴 276.9 4
短期集中型 123.8 1

7.2.5 可視化

Propensity Score Analysis

(a) セッション分類分布 / (b) 傾向スコア分布 / (c) IPW調整後の平均売上

解釈の注意:
視聴回数は内生変数(医師の自発的行動)であり、未観測の交絡は残る
結果は相関関係として解釈し、因果効果の上限値と考えるべき

7.3 MR活動によるMediation分析

MR活動(訪問回数)は 企業が制御可能な変数。MR活動が視聴を介して売上に影響する経路を検証。

7.3.1 分析の枠組み

Mediation仮説:
MR活動 → 視聴機会増加 → 売上向上

2段階推定:
① Stage 1: MR活動 → 視聴回数 (相関)
② Stage 2: 予測視聴 → 売上 (間接効果)
③ Direct: MR活動 → 売上 (直接効果、視聴を制御)

7.3.2 Stage 1: MR活動 → 視聴

指標
MR活動-視聴相関係数 -0.0121
MR活動の係数 -0.0125
p値 0.3827
有意性 n.s.

相関係数が -0.012 と非常に小さく、 MR活動だけでは視聴をほとんど説明できない。 これは視聴が複数チャネル(ベンダーサイト、MRメール、web講演会など)から発生し、 MR活動以外の要因が大きいことを示唆。

7.3.3 Stage 2: 視聴 → 売上

変数 係数 SE p値 有意性
視聴回数 -74.472 53.801 0.166400 n.s.

7.3.4 Mediation効果の分解

効果
Direct Effect (直接効果) 1.047
Indirect Effect (間接効果) 0.930
Total Effect (総効果) 1.977
間接効果の割合 47.0%

間接効果(MR活動→視聴→売上)が総効果の約 47% を占める。

7.3.5 可視化

MR Activity Mediation Analysis

(a) MR活動-視聴の散布図 / (b) MR活動と視聴の時系列 / (c) 直接効果の係数

Mediation分析の結論

MR活動自体も内生的(売上が良い施設にMRが多く訪問)な可能性あり

視聴回数のみを使うよりは頑健な推定

MR活動は制御可能な変数として、意思決定に活用可能


7.4 統合的解釈と実務的示唆

3つの分析から得られた知見の統合

1️⃣ 視聴パターンと売上の関連性 (7.1)
  • Intensive Margin(既存医師への追加視聴) の方が売上との関連性が強い
  • 視聴回数が多い医師ほど高売上の傾向(ただし因果関係ではない)
2️⃣ 時間的パターンと選択バイアス (7.2)
  • 視聴パターンを セッションベース で分類すると、定期視聴型が最も高売上
  • 傾向スコアによる調整後も、この傾向は維持される
  • ただし、視聴意欲の高い医師が元々高売上である可能性は排除できない
3️⃣ 制御可能な変数としてのMR活動 (7.3)
  • MR活動と視聴の相関は ほぼゼロ(相関係数 -0.012)
  • 視聴は多様なチャネル(ベンダーサイト、メール、web講演会)から発生
  • MR活動単独では視聴行動を制御できない

実務的な示唆と推奨アクション

✅ 推奨される戦略
  1. 既存視聴医師へのフォローアップ強化
    • 定期的なリマインド配信(メール、MR経由)
    • 新コンテンツのプッシュ通知
    • 視聴履歴に基づくパーソナライズ配信
  2. チャネル横断的な接触機会の創出
    • ベンダーサイトでの露出強化
    • web講演会との連携
    • MR訪問時のコンテンツ紹介
  3. 属性ベースのターゲティング精緻化
    • 傾向スコアモデルを活用し、視聴確率の高い医師を優先
    • 経験年数、地域、施設タイプなどの属性を考慮
⚠️ 注意すべき点
  • 視聴は結果であって原因ではない可能性: 元々興味のある医師が視聴し、その医師が処方する
  • 配信数を増やすだけでは視聴増加は保証されない: 多様なチャネルからのアクセスが重要
  • MR活動だけでは視聴をコントロールできない: 統合的なマーケティング戦略が必要
📊 今後の分析の方向性
  • チャネル別の視聴効率の測定(どのチャネルが最も視聴に繋がるか)
  • コンテンツタイプ別の効果検証(疾患情報 vs 製品情報など)
  • 視聴タイミングと処方タイミングのラグ分析
  • RCT(ランダム化比較試験)による因果効果の厳密な検証

8. MR vs デジタルバランス分析:最適リソース配分

分析目的: MR活動とデジタルチャネルの最適なバランスを定量的に評価し、 具体的なリソース配分シナリオを提示する。

8.1 限界効果の推定

TWFE回帰により、MR活動とデジタル視聴それぞれの売上への限界効果を推定。

変数 限界効果(万円/回) SE p値 有意性
MR活動 2.00 0.55 0.000271 ***
デジタル視聴 9.38 1.71 0.000000 ***
重要な知見:
デジタル視聴の限界効果(9.38万円)は、 MR活動(2.00万円)の 約4.7倍

8.2 コスト効率性の比較

コスト仮定を用いて、各チャネルの費用対効果を計算。

コスト仮定(万円):
- MR 1名あたり年間コスト: 1,000万円
- MR活動1回あたりコスト: 2.0万円
- デジタル配信1回あたりコスト: 0.5万円
指標 MR活動 デジタル視聴
1回あたりコスト(万円) 2.0 0.5
1回あたり売上貢献(万円) 2.00 9.38
費用対効果(売上/コスト) 1.00 18.76
コスト効率性:
デジタルの費用対効果は、MRの 約19倍

8.3 リソース配分シナリオ

複数のシナリオで、コストと売上のトレードオフを検証。

シナリオ MR FTE デジタル予算
(万円)
総コスト
(万円)
コスト変化 売上変化 ROI
現状維持 100名 5,000 105,000 +0
(+0.0%)
+0.0% 5.75
MR半減+デジタル増額 50名 7,621 57,621 -47,379
(-45.1%)
+0.0% 10.48
MR 30%減+デジタル増額 70名 6,573 76,573 -28,427
(-27.1%)
+0.0% 7.89
デジタル特化(MR最小) 20名 9,194 29,194 -75,806
(-72.2%)
+0.0% 20.68
同コストでデジタル最大化 20名 85,000 105,000 +0
(+0.0%)
+16.3% 6.69

8.4 可視化

MR vs Digital Balance Analysis

(a) シナリオ別コスト / (b) 売上変化率 / (c) ROI / (d) 効率的フロンティア / (e) 配分マップ / (f) 限界効果 / (g) コスト効率性

8.5 実務的推奨アクション

💡 最適シナリオの提案

推奨: デジタル特化(MR最小)

📋 現状
MR FTE: 100名
デジタル予算: 5,000万円
総コスト: 105,000万円
ROI: 5.75
✅ 推奨配分
MR FTE: 20名
デジタル予算: 9,194万円
総コスト: 29,194万円
ROI: 20.68
  • コスト削減額: 75,806万円 (72%削減)
  • 売上への影響: +0.0%
  • ROI改善: 5.75 → 20.68 (259.7%向上)

⚠️ 重要な注意事項

  • MRとデジタルの両方が内生変数であり、結果は相関関係を示す
  • シミュレーション結果は参考値として扱い、実際の意思決定では追加的な検証が必要
  • 実際のリソース配分変更は、段階的に実施し、効果を検証しながら進めることを推奨
  • MR活動には定量化されない価値(関係構築、情報収集など)も存在する

9. 結論・主な知見

全体効果

  • TWFE推定 (双方向固定効果): ATT (処置群の平均処置効果) = 29.21 (SE=7.58, ***)
  • CS推定 (Callaway-Sant'Anna): ATT = 35.37 (SE=8.44, ***)

チャネル別効果 (CS推定)

  • Webinar: ATT = 31.64 (N=39, ***)
  • e-contents: ATT = 33.62 (N=32, ***)
  • web講演会: ATT = 28.96 (N=40, ***)

CATE (条件付き平均処置効果 / 異質的処置効果)

  • baseline_cat: 低(23.5), 中(19.6), 高(66.9)
注意事項:
- サブグループのNが小さいため検出力は限定的
- 各サブグループのATTは共通の対照群を使用
- 本分析はシミュレーションデータに基づく方法論検証